Análisis de imagenes de redes sociales de agencias de seguridad mexicanas
Qué queremos lograr con este estudio?
TBD
Qué se está analizando?
A continuación el proceso paso a paso
Descargamos 1348 imagenes de la página de Dacebook de la Secretaría de Marina de México junto con sus metadatos
La descarga fue manual siguiendo los URLs de la siguiente tabla:
Analizamos cada una con los algoritmos de clasificación de escena de Amazon Rekognition
Obtenemos de ese servicio una lista de posibles temáticas detectadas junto con el % de confianza
Definimos un diccionario de palabras relacionadas a la milicia para eliminar el resto de las temáticas no militares detectadas
Diccionario:
## [1] "Boat" "Vehicle" "Transportation"
## [4] "Watercraft" "Vessel" "Military"
## [7] "Navy" "Cruiser" "Ship"
## [10] "Destroyer" "Battleship" "Coast Guard"
## [13] "Helicopter" "Aircraft" "Airplane"
## [16] "Bomber" "Warplane" "Jet"
## [19] "Sailor Suit" "Officer" "Military Uniform"
## [22] "Operating Theatre" "Swat Team" "Word"
## [25] "Tower" "Pier" "Dock"
## [28] "Port" "Helmet" "Lifejacket"
## [31] "Army" "Armored" "Cockpit"
## [34] "Crash Helmet" "Hardhat" "Weapon"
## [37] "Weaponry" "Marching" "Soldier"
## [40] "Security" "Sailboat" "Airfield"
## [43] "Landing" "Badge" "Emblem"
## [46] "Barge" "Gun" "Troop"
## [49] "Flare" "Life Buoy" "Freighter"
## [52] "Tanker" "Rotor" "Yacht"
## [55] "Propeller" "Biplane" "Tank"
## [58] "Captain" "Dynamite" "Bomb"
## [61] "Cannon" "Guard" "Parachute"
## [64] "Sniper" "Amphibious Vehicle" "Shooting Range"
Filtrado de temáticas con diccionario
Definimos un umbral de confianza para deducir ocurrencia de temas militares
Preguntas de investigación
Cuántas imagenes quedaron fuera una vez aplicados los filtros de confianza >= 65% y el filtro de diccionario de etiquetas militares?
## [1] "71.07 %"
Qué etiquetas estaban sobrerepresentadas en las imgs que quedaron fuera? Qué etiquetas estaban subrepresentadas?
Para este resultado, presentaremos las etiquetas detectadas que NO pertenecen al diccionario de palabras relacionadas a la milicia, y además eliminaremos aquellas categorías que solo estén representadas en 10 fotografias por considerarlas de poca densidad y por tanto de poca relevancia:Adicionalmente, vamos a eliminar las siguientes etiquetas por ser demasisado generales y poco relacionadas con el objetivo de investigación:
## [1] "Human" "Person" "Apparel"
## [4] "Clothing" "Water" "Nature"
## [7] "Airport" "Vest" "Sky"
## [10] "Pants" "Harbor" "Hardware"
## [13] "Computer Hardware" "Computer Keyboard" "Sunglasses"
## [16] "Art" "Logo" "Trademark"
## [19] "Computer" "Field" "Land"
## [22] "Screen" "Display" "Lawn"
## [25] "Phone" "Countryside" "Weather"
## [28] "Long Sleeve" "Train" "Sitting"
## [31] "Book" "Marina" "Gliding"
## [34] "Banister" "Soil" "Number"
## [37] "Document" "Handrail" "Pedestrian"
## [40] "Airliner" "Railing" "Plot"
## [43] "Cell Phone" "Mobile Phone" "Arecaceae"
## [46] "Palm Tree" "Jacket" "Tie"
## [49] "Graphics" "Room" "Sleeve"
## [52] "Laptop" "Skateboard" "Silhouette"
## [55] "Collage" "Rowboat" "Spoke"
## [58] "Clock Tower" "Diver" "Diving"
## [61] "Desk" "Finger" "Downtown"
## [64] "Astronaut" "Path" "Paintball"
## [67] "Housing" "Suit" "Label"
## [70] "LCD Screen" "Van" "Denim"
## [73] "Jeans" "Sun" "Table"
## [76] "Landscape" "Scenery" "Overcoat"
## [79] "Sunrise" "Keyboard" "Portrait"
## [82] "Monitor" "Road" "Indoors"
## [85] "Dawn" "Dusk" "Red Sky"
## [88] "Sunset" "Cap" "Shoreline"
## [91] "Coast" "Pc" "Photo"
## [94] "Photography" "Sunlight" "Ferry"
## [97] "Tire" "Light" "Asphalt"
## [100] "Tarmac" "Mammal" "People"
## [103] "Text" "Truck" "Face"
## [106] "Team" "Metropolis" "Vegetation"
## [109] "Chair" "Fireman" "Police"
## [112] "Building" "Animal" "Footwear"
## [115] "Shoe" "Paper" "Machine"
## [118] "Hat" "Plant" "Waterfront"
## [121] "Bird" "Electronics" "Sport"
## [124] "Sports" "Ocean" "Sea"
## [127] "Wheel" "Accessories" "Accessory"
## [130] "Urban" "Adventure" "Grass"
## [133] "Coat" "Police Dog" "Furniture"
## [136] "Beach" "Architecture" "Wood"
## [139] "Shorts" "Automobile" "Car"
## [142] "Flying" "Costume" "Wood"
## [145] "Baseball Cap"
Excluyendo estas etiquetas, nos queda la siguiente representación:
Dato curioso
Hemos eliminado la etiqueta Paintball porque las imagenes que tienen asignada esta etiqueta son de este tipo:
Lo cual definitivamente no es correcto.
Qué etiquetas están relacionadas con una percepción positiva de la SEMAR ante la sociedad y con qué frecuencia aparecen?
Para esta pregunta definiremos las siguientes categorías: 1. acercamiento con la sociedad civil 2. acciones de rescate y manejo de desastres 3. asistencia en campañas de salud 4. Proyección de imagen positiva 5. Proyección de imagen patriótica 6. Inclusión y género
Luego tomaremos armaremos 3 diccionarios con las etiquetas que creemos que están relacionadas con cada una, sin repetir etiquetas en diferentes categorías
Posteriormente agrupamos este diccionario en términos similares para formar categorías:
- tipos de publicación VS tipos de reacción
- línea de tiempo de actos específicos - fechas?
Líneas de investigación que requieren de mayor elaboración
- Capacidad de armamento: esta línea requiere de un modelo de computer vision específicamente entrenado para identificar armamento y ejecutarlo en el subconjunto de imagenes cuya etiqueta si tiene relación con la milicia.
- Análisis de sentimiento de comentarios hechos a fotografías: de momento no tenemos disponibles dichos comentarios.